2025 iThome 鐵人賽
分享至
目標很豐滿,實踐很骨感。
這一次鐵人賽希望自己能琢磨出一個 best practice。在實踐RL上面能夠找出一條基本路線然後提供給各方大佬批判指教。
目標是能給人抄作業,給未來的自己抄作業。所以面向的自己比較像是已經有了 machine learning 基礎,至少已跑過 coursera DL 課程的朋友。
這一個系列文會聚焦在幾個實踐上我自己卡到過的問題。
Reinforcement learning 基本算法 和 遭遇到的問題。李宏毅老師王樹森老師
IT邦幫忙